# Author    : CoffeeChicken
# Date      : 2020-10-08 16:40
# Function  : 演示 使用xpath来爬取数据

from lxml import etree
import requests

tree = etree.parse("test.html")
# // 表示定位到页面中所有的标签
# 使用索引定位时, 索引从1开始

# 单个/只能获取直系标签内容
# r = tree.xpath("//div[@class='tang']//li[5]/a/text()")
# 双//可以取出该标签下的所有内容
# r = tree.xpath("//div[@class='tang']//text()")

# 使用@属性的方法来取出属性值
r = tree.xpath("//div[@class='song']/img/@src")
# xpath永远返回的是一个列表
print(r)
